--- layout: post title: 'An analysis about olympics' ---
Phân tích được thực hiện nhằm trực quan hoá dữ liệu về Olympics (Thế vận hội) để từ đó người xem có thể:
Dữ liệu được sử dụng trong phân tích là dữ liệu về các nước tham dự, cũng như thành tích các nước trong thế vận hội từ năm 1896 đến 2016 (120 năm).
Các trường dữ liệu trong tập data trên là:
Data frame cụ thể như sau:
Tập dữ liệu có một số trường thông tin bị missing ví dụ:
Như vậy, trừ phi phải sử dụng đến phân tích liên quan đến weight, height và age, nếu không ta không cần xử lý gì dữ liệu bị thiếu này.
Nhằm phân tích thêm góc nhìn là khu vực địa lý (châu lục của quốc gia tham gia thế vận hội) ta có sử dụng thêm data về quốc gia và châu lục
Dữ liệu này gồm 2 cột:
Thế vận hội có một số đối tượng mà ta quan tâm:
Thế vận hội bắt đầu được tổ chức vào năm 1896 và suốt từ đó đến nay, ngoại trừ giai đoạn chiến tranh thế giới, thì cứ 4 năm một lần thế vận hội mùa hè được tổ chức.
Thế vận hội mùa động được bắt đầu năm 1924, sau khi chiến tranh thế giới thứ nhất kết thúc khoảng 10 năm và cũng được tổ chức 4 năm một lần.
Đến những năm 80 thì 2 thế vận hội này không được tổ chức cùng năm nữa mà xen kẽ nhau. Do nếu tổ chức cùng lúc thì quá tốn kém và gây nhiều khó khăn cho ban tổ chức và các quốc gia tham dự.
Số lượng các môn thể thao đã tăng mạnh kể từ những năm 80 cho đến nay, với thế vận hội mùa hè hiện tại có 34 môn còn thế vận hội mùa đông là 15 môn.
Tại thế vận hội (tính cả mùa hè và mùa đông):
Các môn được tổ chức thường xuyên nhất (gần 30 lần) là Bơi lội, thể dục dụng cụ, đấu kiếm, đua xe đạp, và điền kinh.
Các môn có nhiều nội dung thi đấu nhất là Bắn súng, điền kinh (với hơn 80 bộ môn thi đấu từng xuất hiện trong suốt những năm tổ chức thế vận hội). Ít hơn một chút ta thấy có bơi lội và đua xe đạp.
Hầu hết những môn có nhiều nội dung thi đấu thì thường là những môn được tổ chức thường xuyên (trong nhiều năm). Điều này có thể lý giải mối quan hệ 2 chiều là môn nào được tổ chức lâu năm thì người ta sẽ có nhiều thời gian để nghĩ ra thêm nhiều nội dung. Đồng thời môn nào càng có khả năng nghĩ ra được nhiều nội dung thi đấu đa dạng thì càng được ưa chuộng và tổ chức nhiều.
Tất nhiên cũng có những ngoại lệ như Bóng đá, Bóng rổ, hay Hockey những môn thể thao rất phổ biến dù có Olympics hay không.
Do có sự khác biệt đáng kể giữa các môn thể thao của thế vận hội mùa đông và mùa hè, nên bắt đầu từ phần này ta sẽ chỉ phân tích Thế vận hội mùa hè.
Trong thế vận hội mùa hè, ta có thể thấy:
Các bộ môn lâu đời và phổ biến được nhiều quốc gia tham gia tranh tài nhất ví dụ Bơi lội, điền kinh, bắn súng, thể dục dụng cụ, …
Sau các cuộc chiến tranh thế giới thứ nhất và thứ hai, đã có nhiều môn thể thao bị huỷ bỏ. Ví dụ như Tug of war (kéo co) hoặc Art Competition thì đã được chuyển sang Olympic về nghệ thuật.
Một số môn mới xuất hiện nhưng đã thu hút được nhiều nước tham gia như Judo, Taekwondo, … đây thường là các bộ môn đã phổ biến ở cộng đồng nhiều nước nhưng đến gần đây mới được Uỷ ban Olympics đưa vào thi đấu.
Sự tham gia của các quốc gia tại thế vận hội được thể hiện ở số vận động viên mà họ cử đến ở mỗi môn thể thao.
Ta sẽ chia các quốc gia vào các vùng lãnh thổ và xem trung bình mỗi năm thì các nước cử bao nhiêu vận động viên thi đấu, top 5 nước có nhiều vận động viên nhất.
Dễ thấy, các quốc gia lớn, phát triển có nhiều vận động viên tham gia nhất.
Nếu xét theo từng châu lục thì:
Trong quá khứ phụ nữ thường ít khi được cử đi thi đấu, hoặc chính xác hơn là có ít nội dung thi đấu cho nữ nhưng càng ngày thì điều này càng được thay đổi.
Gần đây, số vận động viên nữ tham gia cũng đang tiến gần bằng số lượng vận động viên nam.
Trước giai đoạn thế chiến thứ I (năm 1914) tỷ lệ vận động viên nữ rất thấp, đây là giai đoạn đầu của olympic vì thế có rất ít môn dành cho nữ, quyền lợi của phụ nữ lúc này cũng rất hạn chế.
Sau thế chiến thứ II (năm 1945) tỷ lệ này đã tăng mạnh lên 18% và tiếp tục tăng những năm sau đó, thời điểm này thì nữ quyền bắt đầu được chú ý hơn và nhiều môn thể thao cho nữ ra đời.
Sau chiến tranh lạnh (1989) tỷ lệ này đã đạt hơn 30% và tăng đến gần 50% trong những năm gần đây, vì sự thay đổi nhận thức của cộng đồng với hoạt động thể thao dành cho phụ nữ, lúc này phụ nữ đã tham gia thế vận hội không kém nam giới.
Thành tích của quốc gia được thể hiện ở số huy chương mà họ giành được ở mỗi môn thể thao.
Ta sẽ xét 10 quốc gia có số lượng huy chương lớn nhất trong lịch sử thế vận hội mùa hè:
Dễ thấy Mỹ dẫn đầu thế giới với số lượng huy chương khá áp đảo
Phía sau là Nga, Anh, Đức, Pháp các nước châu Âu lớn có số huy chương tương tự nhau.
Một cường quốc là Trung quốc do mới tham gia Olympic chưa lâu nên số lượng huy chương không thể so sánh với những nước phát triển trên.
Nga và Đức vẫn là những đối trọng lớn nhất của Mỹ trong lĩnh vực thể thao.
Để phản ánh thành tích các quốc gia ở thế vận hội một cách chính xác và cập nhật hơn, ta sẽ xét Số huy chương mà các quốc gia giành được trong 10 kỳ thế vận hội gần nhất (tính từ năm 1988, khi Liên xô bắt đầu tan rã và Trung quốc tham gia thường xuyên ở Olympics). Ta cũng chỉ xét thế vận hội mùa hè.
Mỹ vẫn dẫn đầu về tổng số huy chương, ngay phía sau là Nga, Đức và Trung Quốc. Có thể thấy trong những kỳ thế vận hội mùa hè gần đây thì Trung Quốc đang dần theo kịp các quốc gia lớn khác.
Đã xuất hiện các quốc gia châu Á khác như Nhật, Hàn bên cạnh sự thống trị của các nước châu Âu
Cụ thể theo thời gian, số lượng huy chương và thứ hạng của các nước đã thay đổi như thế nào?
Một số nước vào top 10 được 1 năm rồi sau đó lại bị rơi ra ngoài, ví dụ Hàn Quốc, Tây Ban Nha, …
Một số nước rất ổn định trong top 10, trừ Mỹ thì có Anh, Đức, Trung Quốc, Australia, Nga
Có những kỳ Olympics Mỹ áp đảo hoàn toàn các nước khác, nhưng cũng có những kỳ không có nhiều chênh lệch ví dụ Olympics năm 2000 khi Nga gần đạt thành tích ngang Mỹ.
2008 do là nước chủ nhà nên Trung Quốc vượt Nga để trở thành nước đứng thứ 2.
Thể hiện số huy chương các đoàn thể thao giành được trên bản đồ thế giới:
Mặc dù khu vực Bắc Mỹ có số huy chương rất lớn nhưng Nam Mỹ lại có ít nước giành được huy chương.
Châu Phi có nhiều nước không có huy chương hoặc giành được rất ít.
Ở châu Á khu vực Nam Á, Đông Nam Á có rất ít nước có huy chương.
Châu Âu thì các nước phân bố huy chương khá đồng đều, không có nhiều sự chênh lệch, trừ Đức có nhiều hơn hẳn các nước khác.
Bắc bán cầu có thành tích ở Olympics tốt hơn nhiều so với Nam bán cầu.
Câu hỏi đặt ra là liệu GDP, dân số, HDI (chỉ số phát triển con người) của 1 quốc gia có tương quan gì với Olympic không.
Tương quan giữa GDP và thành tích tại Olympic:
Một số quốc gia có GDP/người rất cao như Qatar, Nauy, UAE nhưng thành tích tại Olympic lại thấp.
Trung Quốc thì ở tình trạng ngược lại khi GDP đầu người của họ thấp nhưng thành tích tại Olympic lại tốt
Các nước như Mỹ, Anh, Đức thì có tương quan đồng biến giữa GDP đầu người và thành tích tại Olympic thể hiện ở việc, GDP đầu người càng cao thì thành tích càng tốt.
Nếu không tính các ngoại lệ như UAE, Trung quốc, … thì có mối liên hệ đồng biến khá rõ giữa GDP đầu người và thành tích tại Olympic.
Nếu xét chỉ số HDI
Ta thấy rõ một sự phân hoá giữa các nước khi sử dụng HDI, các nước có số huy chương cao được phân thành 2 nhóm khá rõ là nhóm có HDI cao và HDI thấp
Như vậy nếu kết hợp cả 2 chiều là HDI và GDP bình quân thì có thể phân loại khá tốt các nước ở Olympic.
Ta thử vẽ đồ thị với cả 2 chiều HDI và GDP bình quân đầu người:
Như vậy, có tương quan mạnh và đồng biến giữa GDP bình quân đầu người, HDI với số lượng huy chương quốc gia giành được. Bên cạnh đó ta cũng thấy được sự tương quan giữa GDP bình quân với HDI.